
import re

text_test = '''
    这是一段测试文字，里面包含各种数据和信息，但这些数据和信息中间又穿插了很多文字信息。
    大家每天要访问很多网站，比如百度：http://www.baidu.com，微博：https://www.weibo.com，
    B站：https://www.bilibili.com 等等。这是一次Python的入门教程，大家有任何问题可以给我发邮件，
    我的工作邮箱是xiaopan@lnm.imech.ac.cn，大家也可以发邮件到我的私人邮箱：xpgo@163.com。
    我的手机号码是18618100000，平时也用另外一个手机号：13973240000，我的办公室电话是：010-82001234。
    我故意写一个奇怪的网址：abc&&.88，还有一个奇怪的邮箱：**@102.cc作为干扰。
'''

# 找网址
regex_url = r"https?://(?:[-\w.]|(?:%[\da-fA-F]{2}))+"
match_url = re.findall(regex_url, text_test)
print(match_url)

# 找邮箱
regex_email = r"[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+"
match_email = re.findall(regex_email, text_test)
print(match_email)

# 找手机号
regex_phone = r"1\d{10}"
match_phone = re.findall(regex_phone, text_test)
print(match_phone)
